![Научно-технический вестник информационных технологий, механики и оптики](/images/mag-ntv.png)
Метод формирования сегментов информационной последовательности с использованием функционала качества моделей обработки
![Научно-технический вестник информационных технологий, механики и оптики](/images/mag-ntv.png)
Аннотация:
Введение. Постоянно возникающая потребность увеличения эффективности решения задач классификации и предсказания поведения объектов наблюдения вызывает необходимость совершенствования методов обработки данных. В работе предлагается метод повышения показателей качества моделей машинного обучения в задачах регрессии и прогнозирования. Метод. Предложенная обработка информационных последовательностей предполагает применение сегментации входных данных. В результате разделения данных образуются сегменты с различными свойствами объектов наблюдения. Новизна метода заключается в разделении последовательности на сегменты c использованием функционала качества моделей обработки на подвыборках данных. Это позволяет применять лучшие по качественным показателям модели на разных сегментах данных. Полученные сегменты являются отдельными подвыборками, на которые назначаются лучшие по качественным показателям модели и алгоритмы машинного обучения. Основные результаты. Для оценки качества предлагаемого решения выполнен эксперимент с использованием модельных данных и множественной регрессии. Рассчитанные значения показателя качества Root Mean Squared Error (RMSE) для выбранных алгоритмов на экспериментальной выборке и при различном количестве сегментов продемонстрировали повышение качественных показателей отдельных алгоритмов при увеличении количества сегментов. Предлагаемый метод позволяет повысить показатели RMSE в среднем на 7 % за счет сегментации и назначения моделей, которые имеют наилучшие показатели в отдельных сегментах. Обсуждение. Результаты метода могут применяться дополнительно при разработке моделей и методов обработки данных. Представленное решение направлено на дальнейшее усовершенствование и расширение ансамблевых методов. Формирование многоуровневых модельных структур, осуществляющих обработку, анализ поступающих информационных потоков и назначение наиболее подходящей модели для решения текущей задачи, позволяет уменьшить сложность и ресурсоемкость классических ансамблевых методов. В результате уменьшено влияние проблемы переобучения, снижена зависимость результатов обработки от базовых моделей, повышена оперативность настройки базовых алгоритмов в случае трансформации свойств данных и улучшена интерпретируемость результатов.
Ключевые слова:
Постоянный URL
Статьи в номере
- Оптические свойства границы раздела тонких пленок оксидов индия и олова с лазерно-осажденными одностенными углеродными нанотрубками
- Применение ксантеновых флуоресцентных красителей для обнаружения микропластика в почве и проведения фитотестов
- Исследование влияния управляющего напряжения фазового модулятора на основе ниобата лития на величину паразитной амплитудной модуляции и распределение интенсивности оптического излучения на торцах канальных волноводов
- Оценка количественного состава ингибиторов гидратообразования по их инфракрасным спектрам
- Магнитооптические свойства молекул атмосферного воздуха
- Фемтосекундная лазерная модификация золь-гель пленок ZnO:Ag с проявлением дихроизма
- Оценка плотности плазмы в воде на основе теории Келдыша при изменении длины волны накачки
- Люминесцентные и колориметрические свойства покрытых оболочкой диоксида кремния сферических нанокристаллов теллурида кадмия во внешнем электрическом поле
- Синтез наблюдателя электродвижущей силы вращения синхронного двигателя с возбуждением от постоянных магнитов с переключаемой структурой и самонастраивающимися подсистемами фильтрации и оценки углового положения
- Совершенствование алгоритма обработки данных от мультисенсорной системы в задачах определения показателей качества растительных масел
- Совместное легирование тетрабората лития переходными и щелочными металлами
- Анализ химических взаимодействий при заполнении цезием газовой ячейки квантового магнитометра
- Полимерно-солевой синтез и исследование структуры нанопорошков модифицированного ванадием алюмоиттриевого граната
- Повышение безопасности медицинских данных в облачных средах с помощью двойной аутентификации и оптимального шифрования с настройкой ключей
- Устранение искажений слабых изображений астрономических объектов на примере Сатурна, Юпитера и их спутников
- Метод удаления размытия видеоизображения на смартфоне при движении
- Подход к обнаружению неконвенциональной пиксельной атаки на нейронные сети обработки изображений методами статистического анализа
- О влиянии сосредоточенного включения на спектр собственных колебаний струны и балки Бернулли–Эйлера
- Восстановление нестационарного теплового потока от аккумулятора тепловой энергии путем решения обратной задачи теплопроводности
- Применение теории нечетких множеств при решении задач управления временным ресурсом радиолокационной станции мониторинга космического пространства
- Количественная оценка и моделирование биомеханических характеристик голеностопного сустава